بازشناسی گوینده مبتنی بر روشهای ادغام اطلاعات در سطح تصمیم

پایان نامه
چکیده

در میان تمام فناوریها و روشهای تشخیص هویت زیستی، بازشناسی گوینده بر مبنای اطلاعات صحبت را میتوان طبیعیترین و اقتصادیترین روش برای سیستمهای ارتباط انسان-ماشین دانست. همچنین توسعه فناوری پردازش صحبت باعث تقویت بسیاری از کاربردهای بازشناسی گوینده شده است. از آنجا که یکی از مهمترین زمینههای تحقیقاتی فعال که در سالهای اخیر در بسیاری از کاربردها باعث بهبود عمده در بازشناسی گوینده شده است استفاده از روشها و مدلهای ادغام اطلاعات در سطوح مختلف میباشد محور اصلی در این پژوهش، بهبود دقت بازشناسی گوینده با استفاده از ادغام اطلاعات در سطح تصمیم است. در این پایان نامه رویکرد استخراج ویژگیهای جدیدی بر پایه ضرایب کپسترال جهت فراهم سازی منابع تصمیم گیری مورد استفاده در ادغام تصمیم مد نظر قرار گرفته و با توجه به اینکه مشتقات هر تابع بخشی از ویژگیهای مستتر در آن را به نمایش میگذارد از مشتق اول و دوم ضرایب کپسترال مل-فرکانس به عنوان بردارهای ویژگی ثانویه استفاده نموده ایم. این رویکرد به مفهوم استفاده و بهرهگیری همزمان از اطلاعات نهفته در بردار ویژگی، تغییرات(بردار سرعت) و نرخ تغییرات(بردار شتاب) ویژگی میباشد. پس از بازشناسی گوینده مبتنی بر این سه بردار ویژگی به صورت مجزا، جهت بهبود دقت و صحت نتایج بازشناسی و شناسایی، اقدام به طراحی چارچوب ادغام اطلاعات در سطح تصمیم نمودهایم. استفاده همزمان از این بردارهای ویژگی در بستر ادغام تصمیم تاکنون توسط محققان گزارش نشده است. استفاده از روشهای مناسب جهت خوشه بندی بردارهای ویژگی از جمله روش کوانتیزه کردن برداری و همچنین توابع تعیین اندازه شباهت از جمله فاصله ماهالانوبیس و فاصله حداکثر شباهت مبتنی بر حد آستانه از دیگر کارهای مهم انجام شده در پژوهش می باشد. در مرحله ادغام تصمیم، نتایج بازشناسیهای اولیه را با استفاده از روشهای ادغام تصمیم از جمله روشهای رأیگیری، رتبه بندی و روش امتیازدهی ترکیب و نتیجه را به عنوان بازشناسی نهایی استفاده ایم. نتایج نشان دهد که روشهای ادغام تصمیم باعث بهبود قابل توجه در دقت بازشناسی گوینده نسبت به حالت بدون ادغام شود. از نتایج دیگر این است که استفاده همزمان از اطلاعات مستتر در بردارهای تغییرات ضرایب کپسترال و بردارهای نرخ این تغییرات برای بازشناسی گوینده باعث بهبود کارایی سیستم بازشناسی گوینده میشود.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تطبیق گوینده در بازشناسی گفتار پیوسته براساس تخمین map مبتنی بر تبدیل mllr

روشهای مختلفی برای تطبیق گوینده در سیستمهای بازشناسی گفتار معرفی گردیده اند. در برخی روشها نظیر تخمین map تنها مدلهایی که داده آموزشی متناظرشان موجود باشد تازه سازی می شوند و برای بهبود قابل توجه دقت بازشناسی، داده آموزشی نسبتاً زیادی مورد نیاز است. در برخی دیگر نظیر mllr که تعدادی تبدیلات عمومی بر روی خوشه های مدلها اعمال می شود، برای دادگان کم آموزشی نتایج مطلوبی حاصل می شود، اما با افزایش داد...

متن کامل

بهبود نرخ بازشناسی ارقام دست نویس فارسی با استفاده از روش های ادغام در سطح تصمیم

هدف یک سیستم بازشناسی الگو قراردادن الگوها با کمتـرین خطـا، در کـ?س مربـوط بـه خودشـان اسـت. بازشناسی ارقام دستنویس فارسی یکی از مسائل مهم در حوزه بازشناسی الگو می-باشد. تحقیقات در این زمینه چندین دهه است که آغاز شده است و هنوز هم در حال پیشرفت می-باشد. در?سیستم های معمولی بازشناسی الگو از یـک طبقـه بنـد اسـتفاده مـی شـود کـه ?زمـه آن، بکـارگیری یـک مـدل? طبقه بندی پیچیده یا استفاده از ویژگی ها...

15 صفحه اول

بررسی روش های طیف سنجی همکارانه مبتنی بر ادغام اطلاعات-تصمیم در رادیوی شناختگر

افزایش روز افزون نیاز به منابع طیفی همزمان با رشد روز افزون تکنولوژی و با توجه به محدودیت دسترسی به طیف و موثر نبودن سیاست های فعلی تخصیص طیف نیاز به تکنولوژی ای را که بتواند بصورت فرصت طلبانه از منابع طیفی استفاده کند، تشدید می کند. رادیوی شناختگر بعنوان یک تکنولوژی جدید بمنظور استفاده بهینه از طیف برای اولین بار در سال 1999 توسط میتلا معرفی شد. ایده اصلی در رادیوی شناختگرتمهید اشتراک منابع و ...

رتبه‌بندی واج‌های گفتار فارسی از نظر کارآیی در بازشناسی گوینده

در این مقاله، کارآیی واج­های گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآیی­ها، رتبه­بندی واج­ها صورت گرفته‌اند. جهت برآورد کارآیی واج­ها، از یک معیاری که به­صورت نسب « فاصلة بین­گوینده­ای» واج­ها به « فاصلة در گوینده‌ای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیده­ایم، استفاده شده است.­ آزمایش­ها و محاسبات لازم برای کلیه واج­های گفتار...

متن کامل

طبقه بندی راه های شهری مبتنی بر ادغام در سطح تصمیمات داده های نوری و راداری

در این مقاله قابلیت تصاویر اسپات و سار به منظور تشخیص عارضه راه در مناطق شهری مورد بررسی قرار گرفته است. شباهت طیفی عارضه راه با سقف آسفالت ساختمان ها در مناطق شهری موجب بروز مشکلاتی در تشخیص راه مبتنی بر داده های اپتیک از جمله اسپات می گردد. از سوی دیگر، تصاویر سار با اینکه قابلیت خوبی در تشخیص راههای فرعی و باریک دارند، اما در تشخیص راه از پوشش گیاهی دچار مشکلاتی می شود. بنابراین، نتایج حاصل ...

متن کامل

بازشناسی گوینده وابسته به متن

دراین تحقیق طراحی و بکارگیری سیستمهای بازشناسی گوینده ارائه شده است. بازشناسی گوینده، استفاده از یک ماشین جهت بازشناسی یک شخص از یک عبارت بیان شده است. این سیستمها می توانند به دو روش عمل کنند : شناسایی یک شخص بخصوص یا تآیید ادعای شخص مدعی، شناسایی یک شخص با استفاده از ویژگیهای فیزیکی از قبیل گفتار، نمونه ای از اهمیت تجاری در زمینه امنیتی است. بازشناسی گفتار یک روش شناسایی شخص، مبتنی بر استخراج...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

سایر - دانشکده صدا و سیمای جمهوری اسلامی ایران

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023